<!DOCTYPE html>
<html dir="ltr" class="client-js" lang="de">
	<head>
		<title>
			DecTree - Hilfe
		</title>
		<meta http-equiv="content-type" content="text/html; charset=UTF-8"/>
		<meta charset="UTF-8"/>
		<meta name="generator" content="MediaWiki 1.21wmf2"/>
		<meta name="robots" content="noindex,nofollow"/>
		<meta name="ResourceLoaderDynamicStyles" content=""/>
		<link rel="stylesheet" href="helpFiles/load_002.css"/>
		<link rel="stylesheet" href="helpFiles/load.css"/>
	</head>

	<body style="position: static;">
		<h1 id="firstHeading" class="firstHeading">
			<span dir="auto">
				DecTree - Hilfe
			</span>
		</h1>
		<div id="bodyContent">
			<table id="toc" class="toc">
				<tbody>
					<tr>
						<td>
							<div id="toctitle">
								<h2>
									Inhaltsverzeichnis
								</h2>
							</div>
							<ul>
								<li class="toclevel-1 tocsection-1">
									<a href="#Einleitung">
										<span class="tocnumber">
											1
										</span>
										<span class="toctext">
											Einleitung
										</span>
									</a>
									<ul>
										<li class="toclevel-2 tocsection-2">
											<a href="#Entscheidungsbaeume">
												<span class="tocnumber">
													1.1
												</span>
												<span class="toctext">
													Entscheidungsb&auml;ume
												</span>
											</a>
										</li>
										<li class="toclevel-2 tocsection-3">
											<a href="#ID3">
												<span class="tocnumber">
													1.2
												</span>
												<span class="toctext">
													ID3
												</span>
											</a>
										</li>
									</ul>
								</li>
								<li class="toclevel-1 tocsection-4">
									<a href="#Das_Programm_im_Einzelnen">
										<span class="tocnumber">
											2
										</span>
										<span class="toctext">
											Das Programm im Einzelnen
										</span>
									</a>
									<ul>
										<li class="toclevel-2 tocsection-5">
											<a href="#Genereller_Aufbau">
												<span class="tocnumber">
													2.1
												</span>
												<span class="toctext">
													Genereller Aufbau
												</span>
											</a>
										</li>
										<li class="toclevel-2 tocsection-6">
											<a href="#Die_Menueleiste">
												<span class="tocnumber">
													2.2
												</span>
												<span class="toctext">
													Die Men&uuml;leiste
												</span>
											</a>
										</li>
										<li class="toclevel-2 tocsection-7">
											<a href="#Die_Tabellenansicht">
												<span class="tocnumber">
													2.3
												</span>
												<span class="toctext">
													Die Tabellenansicht
												</span>
											</a>
										</li>
										<li class="toclevel-2 tocsection-8">
											<a href="#Die_automatische_Baumansicht">
												<span class="tocnumber">
													2.4
												</span>
												<span class="toctext">
													Die automatische Baumansicht
												</span>
											</a>
										</li>
										<li class="toclevel-2 tocsection-9">
											<a href="#Die_interaktive_Baumansicht">
												<span class="tocnumber">
													2.5
												</span>
												<span class="toctext">
													Die interaktive Baumansicht
												</span>
											</a>
										</li>
									</ul>
								</li>
								<li class="toclevel-1 tocsection-11">
									<a href="#Weitere_Informationen">
										<span class="tocnumber">
											3
										</span>
										<span class="toctext">
											Weitere Informationen
										</span>
									</a>
									<ul>
										<li class="toclevel-2 tocsection-12">
											<a href="#Format_der_Eingabedateien">
												<span class="tocnumber">
													3.1
												</span>
												<span class="toctext">
													Format der Eingabedateien
												</span>
											</a>
											<ul>
												<li class="toclevel-3 tocsection-13">
													<a href="#CSV-Dateien">
														<span class="tocnumber">
															3.1.1
														</span>
														<span class="toctext">
															CSV-Dateien
														</span>
													</a>
												</li>
												<li class="toclevel-3 tocsection-14">
													<a href="#Excel_Arbeitsmappen">
														<span class="tocnumber">
															3.1.2
														</span>
														<span class="toctext">
															Excel Arbeitsmappen
														</span>
													</a>
												</li>
											</ul>
										</li>
									</ul>
								</li>
							</ul>
						</td>
					</tr>
				</tbody>
			</table>
			<h2> 
				<span class="mw-headline" id="Einleitung">
					Einleitung
				</span>
			</h2>
			<p>
				Die Anwendung "DecTree" erstellt Entscheidungsb&auml;ume mithilfe eines Algorithmus' der auf Basis von
				Entropie sukzessiv das n&auml;chste Attribut ausw&auml;hlt.
			</p>
			<h3>
				<span class="mw-headline" id="Entscheidungsbaeume">
					Entscheidungsb&auml;ume
				</span>
			</h3>
			<p>
				Entscheidungsb&auml;ume dienen zur Klassifikation von Daten aus der echten Welt. Dabei werden "Attribute"
				definiert. Attribute beschreiben eine Eigenschaft in der Welt. So k&ouml;nnte zum Beispiel das Attribut
				"Wetter" die Werte "sonnig", "bew&ouml;lkt" und "regnerisch" annehmen. Eine Kombination der Werte verschiedener
				Attribute wird als "Objekt" bezeichnet. Diese Objekte sollen nun nach einem sogenannten "Zielattribut"
				klassifiziert werden. Wenn ein Datensatz beispielsweise die Attribute "Wetter", "Temperatur",
				"Luftfeuchtigkeit" und "TennisSpielen" aufweist (wobei letzteres das Zielattribut ist), soll bei
				verschiedenen Objekten evaluiert werden, ob ich Tennis spiele oder nicht.
			</p>
			<h3>
				<span class="mw-headline" id="ID3">
					ID3
				</span>
			</h3>
			<p>
				Der ID3-Algorithmus (Iterative Dichotomiser 3) ist ein iteratives Vorgehensmodell zur Attributauswahl bei
				der Erstellung von Entscheidungsb&auml;umen. Dabei wird von jedem noch nicht benutzten Attribut die gewichtete
				Entropie (in anderen Worten: die Unordnung eines Attributes) errechnet. Je kleiner die Entropie, desto besser
				klassifiziert ein Attribut die Datens&auml;tze. Die Datens&auml;tze werden am Attribut mit der kleinsten gewichteten
				Entropie gespalten, wodurch Teilmengen entstehen (und zwar so viele, wie das Attribut verschiedene Werte
				hatte). Dabei entsteht ein neuer Baumknoten. Danach wird von jeder entstandenen Menge wieder die Entropie
				errechnet.
			</p>
			<h2>
				<span class="mw-headline" id="Das_Programm_im_Einzelnen">
					Das Programm im Einzelnen
				</span>
			</h2>
			<h3>
				<span class="mw-headline" id="Genereller_Aufbau">
					Genereller Aufbau
				</span>
			</h3>
			<p></p>
			<a class="image">
				<img alt="Genereller Aufbau" src="helpFiles/general.png" width="850" />
			</a>
			<p></p>
			<p>
				Die Anwendung ist in verschiedene Bereiche eingeteilt: Die Men&uuml;leiste, die Tabellenansicht, der automatische Baum und
				der interaktive Baum. In der Men&uuml;leiste sind verschiedene Men&uuml;punkte zu finden, mit denen
				Dateien geladen und gespeichert werden k&ouml;nnen. Au&szlig;erdem k&ouml;nnen verschiedene Einstellungen ge&auml;ndert werden. In der
				Tabellenansicht werden die Daten erfasst, aus denen ein Entscheidungsbaum generiert werden soll. In der automatischen Baumansicht
				wird automatisch ein Entscheidungsbaum aus den erfassten Daten erzeugt. In der interaktiven Baumansicht kann der Benutzer einen
				eigenen Entscheidungsbaum erstellen. Zudem kann in beiden Baumansichten ein Objekt eingegeben werden, wessen Klassenzuordnung im
				Entscheidunbsbaum visualisiert wird.
			</p>
			<h3>
				<span class="mw-headline" id="Die_Menueleiste">
					Die Men&uuml;leiste
				</span>
			</h3>
			<p>
				Die Men&uuml;leiste ist in drei Punkte eingeteilt: Datei, Einstellungen und Hilfe.
			</p>
			<P>
				Das Datei-Men&uuml;:
			</p>
			<ul>
				<li>
					Importieren...: &Ouml;ffnen eine "Comma Seperated Values"-Datei (CSV) oder Excel Arbeitsmappe (XLS, XLSX). Die ge&ouml;ffnete Datei
					wird in der Tabellenansicht dargestellt.
				</li>
				<li>
					Exportieren...: Speichert die Objekte in der Tabellenansicht in eine "Comma Seperated Values"-Datei (.csv) oder
					Excel Arbeitsmappe (.xls, .xlsx).
				</li>
				<li>
					Beenden: Beendet die Anwendung.
				</li>
			</ul>
			<p>
				Das Einstellungen-Men&uuml;:
			</p>
			<ul>
				<li>
					Sprache: Hier befindet sich f&uuml;r jede unterst&uuml;tzte Sprache ein Untermen&uuml;. Text in der Anwendung wird automatisch aktualisiert.
				</li>
				<li>
					Einstellungen: &Ouml;ffnet einen Dialog, in dem verschiedene Einstellungen vorgenommen werden k&ouml;nnen. Im Einzelnen wären das:
					<ul>
						<li>
							Anti-Aliasisng: Glättet die Kanten in der grafischen Darstellung der Bäume. Kann unter Umständen mehr Leistung beanspruchen.
						</li>
						<li>
							Minimale Objektanzahl: Fällt bei der Baumerstellung die Objektanzahl eines Knotens unter diesen Wert wird ein Blatt erzeugt.
						</li>
						<li>
							Farben für die Knoten: Hier können für verschiedene Knotenarten Farben festgelegt werden.
						</li>
					</ul>
				</li>
			</ul>
			<p>
				Das Hilfe-Men&uuml;:
			</p>
			<ul>
				<li>
					Hilfe: &Ouml;ffnet dieses Hilfefenster.
				</li>
			</ul>
			<h3>
				<span class="mw-headline" id="Die_Tabellenansicht">
					Die Tabellenansicht
				</span>
			</h3>
			<p>
				In der Tabellenansicht werden die Objekte, aus denen die Entscheidunbsb&auml;ume generiert werden, dargestellt. Eine Spalte
				repr&auml;sentiert ein Attribut. Die gelb markierte Spalte ist das Zielattribut. &Uuml;ber die Toolbar k&ouml;nnen verschiedene Aktionen
				ausgef&uuml;hrt werden:
				<ul>
					<li>
						Attribut hinzuf&uuml;gen: F&uuml;gt ein neues Attribut mit dem angegebenen Namen der Tabelle hinzu. Umlaute und Sonderzeichen
						sind erlaubt, allerdings wird von ihrer Verwendung aufgrund von Kodierung auf verschiedenen Systemen abgeraten.
					</li>
					<li>
						Attribut entfernen: Entfernt das ausgew&auml;hlte Attribut aus der Tabelle.
					</li>
					<li>
						Datensatz hinzuf&uuml;gen: F&uuml;gt einen leeren Datensatz am Ende der Tabelle hinzu.
					</li>
					<li>
						Datensatz entfernen: Entfernt den ausgew&auml;hlten Datensatz aus der Tabelle.
					</li>
					<li>
						Zielattribut ausw&auml;hlen: Macht das ausgew&auml;hlte Attribut zum Zielattribut.
					</li>
					<li>
						Tabelle zur&uuml;cksetzen: Entfernt alle Datens&auml;tze und Attribute aus der Tabelle.
					</li>
				</ul>
				Per Doppelklick auf einen Datensatz k&ouml;nnen die Werte f&uuml;r jedes Attribut bearbeitet werden. Die Anwendung erkennt
				dabei automatisch diskrete und numerische Werte. Um einen Entscheidungsbaum aus einer Tabelle erzeugen zu k&ouml;nnen, muss
				die Tabelle vollst&auml;ndig sein. Das hei&szlig;t, dass mindestens ein Datensatz existiert, das Zielattribut gesetzt ist,
				au&szlig;er dem Zielattribut noch ein anderes Attribut existiert und jede Zelle einen Wert aufweist.
			</p>
			<h3>
				<span class="mw-headline" id="Die_automatische_Baumansicht">
					Die automatische Baumansicht
				</span>
			</h3>
			<a class="image">
				<img alt="Baumansicht.jpg" src="helpFiles/tree_view.png" width="850" />
			</a>
			<p>
				Hier wird der aus den Tabellendaten automatisch erstellte Baum angezeigt. Die Knoten werden hierarchisch mit der Wurzel
				beginnend von oben nach unten dargestellt (Top-Down-Layout). Entscheidungsknoten werden gr&uuml;n, Bl&auml;tter blau und ausgew&auml;hlte Knoten rot
				dargestellt (Standardeinstellung, kann ver&auml;ndert werden). Ein Knoten enth&auml;lt folgende Informationen:
				<ul>
					<li>
						Attribut/Ergebnis: Das Attribut (beziehungsweise Ergebnis, falls es sich um ein Blatt handelt), das dieser Knoten
						repr&auml;sentiert.
					</li>
					<li>
						Objektanzahl: Die Anzahl an Objekten, die in diesem Knoten enthalten sind.
					</li>
					<li>
						Entropie: Der Entropiewert der Tabelle, die in diesem Knoten enthalten ist.
					</li>
					<li>
						Anzahl der Objekte jeder Klasse, die in diesem Knoten enthalten sind.
					</li>
				</ul>
				An den Linien ist gekennzeichnet, durch welchen Wert des Attributes eines Knotens der n&auml;chste Knoten erreicht wurde. Rechts
				neben der Zeichenfl&auml;che wird der Baum nochmals mit einem Dateisystem-Layout dargestellt. Hier k&ouml;nnen einzelne Knoten
				ausgew&auml;hlt werden (der ausgew&auml;hlte Knoten wird in der Top-Down-Ansicht entsprechend hervorgehoben). Knoten können auch
				direkt per Klick in die Grafik ausgewählt werden. In der Tabelle darunter werden die Attribute und Objekte angezeigt, die im
				ausgew&auml;hlten Knoten enthalten sind. Die Baumansicht wird nicht automatisch
				aktualisiert, wenn in der Tabellenansicht Daten ge&auml;ndert werden. Stattdessen kann in der Toolbar &uuml;ber den Aktualisieren-Button
				die Erstellung eines neuen Baumes auf Basis der aktuellen Tabellendaten angefordert werden. Durch den Knopf rechts unten kann ein
				Objekt eingegeben werden, wessen Klassenzuordnung im Baum visualisiert wird. Das zu evaluierende Objekt darf jedoch nur Werte enthalten,
				die tatsächlich in der Tabelle vorkommen.
			</p>
			<h3>
				<span class="mw-headline" id="Die_interaktive_Baumansicht">
					Die interaktive Baumansicht
				</span>
			</h3>
			<p>
				Hier wird der aus den Tabellendaten interaktiv erstellte Baum angezeigt. Die Darstellung ist &auml;quivalent zu der der automatischen
				Baumansicht, mit der Ausnahme, dass der Entscheidungsbaum nicht automatisch erstellt wird. Ein Klick auf den Aktualisieren-Button
				setzt den Baum zur&uuml;ck, sodass nur ein einziger leerer Knoten angezeigt wird. Auf einen ausgew&auml;hlten Knoten kann nun durch den
				Attribut-editieren-Button (oder per Doppelklick auf einen Knoten in der Grafik) ein Attribut gesetzt werden. Bei der Auswahl des
				Attributes werden dem Benutzer dabei die jeweiligen
				gewichteten Entropien angezeigt. Wenn ein Attribut ausgew&auml;hlt wurde werden automatisch leere Unterknoten (oder Bl&auml;tter, falls die
				Blattbedingungen erreicht sind) erzeugt. Auf diese kann nun wieder ein Attribut gesetzt werden.
			</p>
			<h2>
				<span class="mw-headline" id="Weitere_Informationen">
					Weitere Informationen
				</span>
			</h2>
			<h3>
				<span class="mw-headline" id="Format_der_Eingabedateien">
					Format der Eingabedateien
				</span>
			</h3>
			<p>
				Die Applikation erlaubt das Laden und Speichern von CSV-Dateien und Excel-Arbeistmappen (XLS und XLSX).
			</p>
			<h4>
				<span class="mw-headline" id="CSV-Dateien">
					CSV-Dateien
				</span>
			</h4>
			<p>
				Das voreingestellte Trennzeichen ist das "," (Komma), dies kann jedoch in den Einstellungen geändert werden. Die Einträge in der ersten
				Zeile werden als Attributnamen gewertet. Als Folge dessen muss die Eingabedatei mindestens eine Zeile enthalten. Zudem darf die erste
				Zeile keine Lücken aufweisen (das Trennzeichen darf nicht zwei mal direkt hintereinander, am Anfang oder am Ende der Zeile stehen).
				Die restlichen Zeilen werden als Objekte gelesen. Davon können beliebig viele vorhanden sein, jedoch werden alle Objekte, die über das
				Applikationslimit (1000) hinausgehen, verworfen. Objekte müssen nicht vollständig sein, jedoch muss die Anzahl der Werte der Anzahl
				der Attribute entsprechen.
			</p>
			<h4>
				<span class="mw-headline" id="Excel_Arbeitsmappen">
					Excel Arbeitsmappen
				</span>
			</h4>
			<p>
				Es werden beide Dateiversionen (XLS und XLSX) unterstützt. Beim Lesen der Eingabedatei wird nur das erste Arbeitsblatt nach Daten
				durchsucht. Die Grafik unten beschreibt welche Zellen gelesen werden.
			</p>
			<a class="image">
				<img alt="Tabellenbereich einer Excel Arbeitsmappe" src="helpFiles/excel_table.png" />
			</a>
			<p>
				Zunächst wird die erste Zeile gesucht, die einen Wert enthält. Die Werte dieser Zeile werden als Attributnamen gewertet (blau unterstrichen
				in der Grafik). Diese Zeile darf keine Lücken aufweisen, jedoch können vor dem ersten und nach dem letzten Wert beliebig viele Leerzellen
				vorkommen. Die restlichen Zeilen werden als Objekte gelesen. Werte außerhalb der Grenzen der Attributzeile werden ignoriert (rot eingekreist
				in der Grafik). Zeilen, die innerhalb der Grenzen der Attributzeile keine Werte aufweisen, werden ebenfalls ignoriert. Ansonsten können
				Zeilen Lücken aufweisen. Der in der Grafik grün umrandete Abschnitt sind die Werte, die letztendlich gelesen werden.
			</p>
		</div>
	</body>
</html>